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(57^ Ah^Hfact: T he-invention relates to a method for creating a bit stream from an indexing tree comprising a plurality of hierarchical 
levels, to each of which one or several index nodes are assigned. Said index nodes contain index data which is sorted in the indexing 
tree according to one or several given criteria. According to the inventive method, the.index data of the index nodes is inserted into 
the bit stream, and the information concerning the position within the bit stream, where the index data of one or several index nodes 
of the hierarchical level located below the hierarchical level of the respective node is situated, is inserted into the bit stream for an 
index node. * 
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Veroflentlicht: 

ohne intemationalen Recherchenbericht und emeut zu ver- 
offentlichen nach Erhalt des Berichts 

Zur Erklarung der Zweibuchstaben- Codes und der anderen Ab- 
kurzungen wird auf die Erkldrungen ("Guidance Notes on Co- 
des and Abbreviations") am Anfang jeder reguldren Ausgabe der 
PCT -Gazette verwiesen. 



(57) Zusammenfassung: Die Erfindung betrifft ein Verfahren zur Erzeugung eines Bitstroms aus einem Indizierungsbaum, wobei 
der Indizierungsbaum eine Mehrzah] von Hierarchieebenen umfasst und jeder Hierarchieebene ein oder mehrere Indexknoten zu- 
geordnet sind, wobei die Indexknoten Indexdaten enthalten, die in dem Indizierungsbaum nach einem oder mehreren vorgegebenen 
Kriterien sortiert sind. In dem Verfahren werden die Indexdaten der Indexknoten in den Bitstrom eingefugt und fur einen Index- 
knoten wird jeweils die Information in den Bitstrom eingefugt, an welcher Stelle im Bitstrom sich die Indexdaten von einem oder 
mehreren Indexknoten der Hierarchieebene, die unterhalb der Hierarchieebene des jeweiligen Knotens liegt, befinden. 
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Beschreibung 

Verfahren zur Erzeugung eines Bitstroms aus einem Indizie- 
rungsbaum 

Die vorliegende Erfindung betrifft ein Verfahren zur Erzeu- 
gung eines Bitstroms aus einem Indizierungsbaum sowie ein Co- 
dierverf ahren und ein Decodierverfahren, welche von dem Ver- 
fahren zur Erzeugung des Bitstroms Gebrauch machen. Ferner 
betrifft die Erfindung eine Codier- und Decodiervorrichtung . 

Es ist haufig erforderlich, bestimmte Inhalte aus einem Bit- 
strom entsprechend einer von einem Benutzer vorab getroffenen 
Abfrage auszulesen bzw. hinsichtlich bestimmter Inhalte zu 
ermitteln, obTdiese Inhalte in dem Bitstrom iiberhaupt. enthal- 
ten sind. Eine von einem Benutzer definierte Abfrage kann 
hierbei mittels einer Abfragesprache, wie SQL (siehe Referenz 
[1]) oder XPATH (siehe Referenz [2]) formuliert. werden. Es 
ist hierbei vorteilhaft, wenn nicht der gesamte Bitstrom nach 
den gewiinschten Inhalt en durchsucht werden itiuss/ sondern wenn 
die Inf ormationen in einer Indizierungsliste oder in einem 
Indizierungsbaum abgelegt sind, so dass lediglich der Teil 
des Bitstroms , in dem der Indizierungsbaum bzw. die Indizie- 
rungsliste gespeichert sind, durchsucht werden muss. 

Das Problem des Auslesens von Daten aus einem Bitstrom ergibt 
sich beispielsweise bei einem mit Hilfe der XML-Sprache (XML 
= extensible markup language) erstellten Dokument, das im 
MPEG7-B1M Format reprasentiert wird. Beziiglich des MPEG7-BiM 
Formats eines XML-Dokuments sei hierbei insbesondere auf das 
Dokument [3] verwiesen. Bei einer derartigen Representation 
wird der erzeugte Bitstrom in mehrere Einheiten (access u- 
nits) aufgeteilt, welche ihrerseits wiederum aus mehreren 
Fragmenten (fragment update units) bestehen. Die Einheiten 
werden codiert und bei Bedarf als MPEG7-BiM-Strom an einen 
oder mehrere Empf anger versandt. 
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In Bezug auf die Abfrage von Inf ormationen aus XML-Dokumenten 
sind bereits eine Vielzahl von Abf ragesprachen bekannt, die 
es erlauben, nach bestimmten Inf ormationen in dem Dokument zu 
suchen. Beispielhaft sei an dieser Stelle auf die bereits er- 
wahnte Abf ragesprache XPATH (siehe Referenz [2]) verwiesen. 
Mit der Abf ragesprache XPATH konnen Auswahlkriterien zur Fil- 
terung gewunschter Inf ormationen innerhalb eines XML Doku- 
ments definiert werden. Ziel einer Abfrage kann hierbei ei- 
nerseits die Bewertung sein, ob eine Einheit des Bitstroms 
fur den Empf anger wichtig ist. Andererseits kann mit Hilfe 
einer Abfrage gezielt auf gewunschte Inf ormationen in dem 
XML-Dokument zuruckgegrif f en werden. Das MPEG7- 
Codierverfahren hat bis jetzt bei der Erzeugung des Bitstroms 
: eines XML-Dokuments keine Mechanismen vorgesehen, die einen 
wahlfreien Zugriff auf bestimmte Elemente des XML-Dokuments 
ermoglichen. Der MPEG7-Bitstrom muss deshalb zur Suche nach 
Elementen decodiert werden. Man erhalt dann wieder ein Doku- 
ment im XML-Format, welches mittels der Abf ragesprache XPATH 
durchsucht werden kann. Das Decodieren und anschlieJiende Ab- 
arbeiten eines XML-Dokuments zur Suche nach spezifischen In- 
halten ist somit sehr zeitauf wendig und fur bestimmte zeit- 
kritische Anwendungen unakzeptabel . Ferner kann das Problem 
auftreten, dass der Speicher im Decoder begrenzt ist, so dass 
der Bitstrom nicht vollstandig decodiert wird. Daruber hinaus 
war der Aufwand des Decodierens unnotig, falls die am deco- 
dierten XML-Dokument durchgef iihrte XPATH-Abf rage negativ ver- 
lauft. 



Im Rahmen von TV-Anytime (TVA) , das in Dokument [4] beschrie- 
ben ist, wird eine Indexstruktur verwendet, die einen wahl- 
freien Zugriff auf bestimmte Elemente eines Datenf ragmentes 
erlaubt. Die Indexstruktur besteht aus mehreren Teilen und 
umfasst eine sog. Key-Index-Liste, in der samtliche indizier- 
te Pfade eines Dokumentes abgelegt werden. Bei einer Abfrage 
werden diese Pfade der Reihe nach mit der Abfrage verglichen, 
bis ein entsprechender Eintrag in der Key-Index-Liste gefun- 
den wird. Durch die Inf ormationen, die in der Key-Index-Liste 
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zu diesem Eintrag gespeichert sind, konnen die Stellen in ei- 
nem Beschreibungsstrom bestimmt werden, an denen der indi- 
zierte Eintrag codiert vorliegt. Durch die Verwendung der 
Key-Index-Liste ist es nicht mehr erf orderlich, uninteressan- 
te Datenf ragmente zu decodieren, so dass weniger Speicher- 
platz wahrend einer Abfrage benotigt wird. Das lineare Durch- 
wandern der Key-Index-Liste ist aber zeitkonsumierend und die 
Ubertragung aller indizierter Pfade ist aufwendig. 

Aufgabe der Erfindung ist es deshalb, ein Verfahren zur Er- 
zeugung eines Bitstroms aus einem Indizierungsbaum zu schaf- 
fen, bei dem die Suche nach indizierten Daten einfach und ef- 
fizient ermoglicht wird. 

Diese Aufgabe wird gemali den Merkmalen der unabhangigen Pa- 
tentanspruche gelost. Weiterbildungen der Erfindung ergeben 
sich aus den abhangigen Anspruchen. 

Der Indizierungsbaum, aus dem mit dem erf indungsgemaiien Ver- 
fahren ein Bitstrom erzeugt wird, umfasst eine Mehrzahl von 
Hierarchieebenen, wobei jeder Hierarchieebene ein oder mehre- 
re Indexknoten zugeordnet .sind und die Indexknoten Indexdaten 
enthalten, die in dem Indizierungsbaum nach einem oder mehre- 
ren vorgegebenen Kriterien sortiert sind. Bei dem erfindungs- 
gemaJSen Verfahren werden die Indexdaten der Indexknoten in 
den Bitstrom eingefugt und ferner wird fur einen Indexknoten 
jeweils die Information in den Bitstrom eingefugt, an welcher 
Stelle im Bitstrom sich die Indexdaten von einem oder mehre- 
ren Indexknoten der Hierarchieebene, die unterhalb der Hie- 
rarchieebene des jeweiligen Knotens liegt, befinden. Durch 
die Speicherung der zusatzlichen Information beziiglich der 
Indexknoten in einer darunter liegenden Hierarchieebene wird 
eine Suche nach bestimmten Indexdaten wesentlich vereinfacht, 
da hierdurch Sprunge zu den fur die Suche relevanten Index- 
knoten ermoglicht werden. Somit wird eine wesentlich effi- 
zientere Abfrage und Suche nach Indexdaten gewahrleistet . 
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In einer bevorzugten Ausf uhrungsf orm ist der Indizierungsbaum 
als sog. B-Tree (= Balanced Tree) aufgebaut, der eine ausge- 
glichene Verteilung der Daten auf die Knoten des Baums ge- 
wahrleistet. Eine genaue Beschreibung des B-Trees findet sich 
5 in der Referenz [5] . 

Die Indexdaten in dem Indizierungsbaum konnen nach beliebigen 
Kriterien sortiert sein, beispielsweise lexikographisch . 

10 In einer besonders bevorzugten Ausf uhrungsf orm sind die In- 
dexdaten nach der Depth-First-Ordnung in den Bitstrom einge- 
fugt. Durch die Verwendung der Depth-First-Ordnung werden die 
Indexdaten in dem Indizierungsbaum zunachst der Tiefe nach in 
den Bitstrom eingefiigt, wodurch die fur eine Abfrage relevan- 

15 ten Inf ormatiohen im Bitstrom benachbart zueinander angeord-': 
net werden und nictxt relevante Inf ormationen eff izient, uber- ' 
sprungen werden konnen. Eine genaue Beschreibung der Depth- 
First-Ordnung findet sich in der Referenz [6] . 

20 In einer weiteren bevorzugten Ausf uhrungsf orm der Erfindung 
umfassen die Indexdaten Pfade eines Dokumentenstrukturbaums , 
der einen Wurzelknoten und eine Mehrzahl von Blattknoten um- 
fasst. Ferner umfassen die Indexdaten vorzugsweise die Werte- 
auspragungen der Pfade und die Positionen der Werteauspragun- 

25 gen in dem Dokument, das durch den Dokumentenstrukturbaum 
dargestellt ist. Daruber hinaus umfassen die Indexdaten in 
einer bevorzugten Ausf uhrungsf orm auch noch die Anzahl der 
Pfade in einem Indexknoten. 

30 Die Pfade konnen hierbei Absolutpfade sein, die von dem Wur- 
zelknoten des Dokumentenstrukturbaums beginnen und zu einem 
Blattknoten des Dokumentenstrukturbaums fuhren. In einer be- 
sonders bevorzugten Ausf uhrungsf orm der Erfindung sind die 
Pfade jedoch relative Pfade, wobei ein relativer Pfad eines 

35 jeweiligen Indexknotens ein Pfad relativ zu einem zuvor in 
den Bitstrom eingefiigt en Pfad des jeweiligen Indexknotens 
oder eines Indexknotens einer uber der Hierarchieebene des 
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jeweiligen Indexknot ens liegenden Hierarchieebene ist. Durch 
die Verwendung von relativen Pfaden werden Gemeinsamkeiten in 
den Pfaden ausgenutzt, denn die Pfade von benachbarten Knoten 
haben meist einen gemeinsamen Anteil . Auf diese Weise kann 
der benotigte Speicherbedarf fur die Indexdaten im Bitstrom 
reduziert werden. Eine weitere Reduzierung des Speicherbe- 
darf s kann dadurch erreicht werden, dass die Pfade des Index- 
knotens, dessen Indexdaten als erste einer Hierarchieebene in 
den Bitstrom eingefugt werden, in einer Reihenfolge umgekehrt 
zu der Reihenfolge, in der die Indexdaten in dem Indexknoten 
angeordnet sind, in den Bitstrom eingefugt werden. Hierbei 
wird die Tatsache berucksichtigt, dass die Indexdaten am Ende 
des ersten Indexknotens einer Hierarchieebene eine groftere 
Ahnlichkeit zu dem Indexknoten der nachsthoheren Hierarchie- 
ebene aufweisen als die Indexdaten am Anfang des ersten In- 
dexknotens. Folglich ergibt sich in best immt en Fallen eine. 
besonders effektive Codierung mittels von relativen Pfaden. 

In einer besonders bevorzugten Ausf uhrungsf orm der Erfindung 
umfassen die Pfade Beschreibungselemente eines XML-Dokuments 
(XML = extensible markup language) , wobei die Pfade insbeson- 
dere XPATH-Pfade des XML-Dokuments sind. 

In einer weiteren Ausf uhrungsf orm der Erfindung sind die In- 
dexdaten mit einem Codierverf ahren binar codiert, insbesonde- 
re mit einem MPEG-Codierverf ahren. In einer besonders bevor- 
zugten Ausf uhrungsf orm wird als Codierverf ahren das MPEG7- 
Codierverf ahren verwendet . 

Neben dem oben beschriebenen Verfahren zur Erzeugung eines 
Bitstroms umfasst die Erfindung ferner ein Verfahren zum Co- 
dieren einer Datenstruktur , bei dem die Datenelemente der Da- 
tenstruktur in einem Indizierungsbaum indiziert sind, wobei 
ein Bitstrom gemafi dem erf indungsgemafien Verfahren erzeugt 
wird und dieser Bitstrom Teil des codierten Datenstroms ist. 
Daruber hinaus umfasst die Erfindung ein Verfahren zum Deco- 
,dieren einer Datenstruktur./^^ derart aus- 
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gestaltet ist, dass eine mit dem soeben beschriebenen Codier- 
verf ahren codierte Datenstruktur decodiert wird. 

Daruber hinaus umfasst die Erfindung ein Verfahren zum Codie- 
5 ren und Decodieren einer Datenstruktur, welches das oben be- 
schriebene Codierverf ahren und Decodierverf ahren umfasst. 



Die Erfindung umfasst auch eine Codiervorrichtung f mit der 
das erfindungsgemafte Codierverf ahren durchfiihrbar ist, sowie 

10 eine Decodiervorrichtung, mit der das erf indungsgemafte Deco- 
dierverf ahren durchfiihrbar ist. Ferner betrifft die Erfindung 
eine entsprechende Vorrichtung zum Codieren und Decodieren, 
mit der das oben beschriebene kombinierte Codier- und Deco- 

K dierverf ahren durchfiihrbar ist. 

15 

Ausfiihrungsbeispiele der Erfindung werden nachfolgend anhand 
der Zeichnungen dargestellt und erlautert. 



Es zeigen 

20 

Fig.l ein Beispiel eines in dem erfindungsgemaBen Verfahren 
verwendeten Indizierungsbaums ; 



Fig. 2 einen Ausschnitt aus dem in Fig. 1 gezeigten Indizie- 
25 rungsbaum; 

Fig. 3 einen Ausschnitt aus einem Bitstrom, der aus dem In- 
dizierungsbaum der Fig. 1 mit dem erfindungsgemaBen 
Verfahren generiert wurde; 

30 

Fig. 4 einen vereinf achten Indizierungsbaum, in dem die In- 
dexdaten lexikographisch geordnet sind und Pfade ei- 
nes Dokumentenstrukturbaums darstellen; 



35 Fig. 5 



den Indizierungsbaum der Fig. 4, wobei die Pfade der 
zweiten Hierarchieebene teilweise als relative Pfade 
dargestellt sind; 
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Fig. 6 den Indizierungsbaum der Fig. 4, wobei alle Pfade der 
zweiten Hierarchieebene als relative Pfade darge- 
stellt sind; und 

Fig. 7 eine Abwandlung des Indizierungsbaums gemafi Fig. 4. 

Figur 1 zeigt beispielhaft einen in dem erfindungsgemafien 
Verfahren verwendeten Indizierungsbaum. Es handelt sich bei 
- diesem Baum uin einen sog. B-Baum (B steht fur Balanced), wel- 
cher haufig bei der Indizierung von Daten zur Anwendung 
kommt. Die Struktur eines B-Baums ist beispielsweise in der 
bereits erwahnten Referenz [5] beschrieben. Der B-Baum weist 
eine ausgeglichene Struktur auf und ermoglicht hierdurch ein 
Suchen mit einem gemessen an der Zahl der Eintrage nur loga- 
rithmischen Aufwand, wohingegen beim Suchen mit einer Liste 
ein linearer Auf wand erforderlich ist. 

Der Indizierungsbaum enthalt eine Mehrzahl von Knoten 1 bis 
10 , wobei in jedem Knoten eine oder mehrere Indexdaten in 
Form von sog. Schlusseln gespeichert sind. Im vorliegenden 
Fall sind die Indexdaten sog. XPATH-Pfade eines Beschrei- 
bungsbaums eines XML-Dokuments. Eine Beschreibung von XPATH- 
Pfaden findet sich in der bereits erwahnten Referenz [2] . Die 
XPATH-Pfade fuhren von dem Wurzelknoten des Beschreibungs- 
baums des XML-Dokuments zu den einzelnen Blattknoten des Be- 
schreibungsbaums des XML-Dokuments. Es werden in dem in die- 
ser Ausfuhrungsf orm verwendeten Beschreibungsbaum als Blatt- 
knoten XML-Elemente mit einfachem Inhalt und alle XML- 
Attribute verwendet. Folglich umfassen die Indexdaten des in 
Figur 1 gezeigten Indizierungsbaums Wurzel-Blatt-Pf ade eines 
XML-Beschreibungsbaums . 

Die XPATH-Pfade sind in dem Indizierungsbaum der Fig. 1 als 
eine Reihe aus Grofi- und Kleinbuchstaben dargestellt und le- 
xikographisch geordnet, wobei jeder Buchstabe fur einen Ele- 
menti»|n,in. dem XML-Beschreibungsbaum s t #rfe^r^ei,s pi e 1 s we i s e 
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bedeutet der Pfad MDMVUFACN in Knoten 1 MPEG7 /Description/ 

MultimediaContent/Video/Usagelnformation/FinancialResults/ 
Account Item/Cos ttype/Name. Neben dem Pfad sind in den Knoten 
auch die Werteauspragungen gespeichert, in denen dieser Pfad 
in dem XML-Dokument auftritt. Im vorliegenden Fall tritt der 
Pfad MDMVUFACN im Indexknoten 1 zweimal mit den Auspragungen 
"Total for Production" und "Broadcast" auf. Demgegeniiber 
tritt beispielsweise der Pfad MDMVUAFAc im Indexknoten 2 nur 
einmal mit der Auspragung "EUR" auf. 

Die Nummerierung der Indexknoten in dem Indizierungsbaum der 
Figur 1 entspricht der Reihenfolge, in welcher die Indexdaten 
mit Hilfe des erf indungsgeraafien Verfahrens in den Bitstrom 
eingefugt werden. Die Reihenfolge entspricht hierbei einer 
sog. Depth-First-Ordnung, die beispielsweise in der bereits 
erwahnten Referenz [6] beschrieben ist. Durch das Einf iigen 
der Indexdaten in den Bitstrom gemafl der Depth-First-Ordnung 
ergibt sich eine geringere Komplexitat beim Zugriff auf die 
Indexdaten, da bei der Suche nach Indexdaten nicht relevante 
Inf ormationen tibersprungen werden. 

In Figur 2 ist ein Ausschnitt aus dem Indizierungsbaum der 
Figur 1 gezeigt, an dem an einem Beispiel die Abfrage von In- 
dexdaten in diesem Baum erlautert wird. Es handelt sich hier- 
bei um die Abfrage, ob der XPATH-Pfad MPEG7 /Description/ 
Multimediacontent/Video/Usagelnformation/Availability/ 
Dissemination/Disseminator/Agent/Name die Werteauspragung 
"Discovery" enthalt (in Kurzschreibweise MDMVUADDAN = "Disco- 
very") . Da der Suchstring MDMVUADDAN lexikographisch kleiner 
ist als der XPATH-Pfad "MDMVUFACN" des Indexknotens 1 wird 
auf den Indexknoten 2 zuriickgegrif f en . Der Suchstring ist 
wiederum lexikographisch kleiner als der Eintrag "MDMVUAFAc" 
des Indexknotens 2. Deshalb wird auf den links des Indexkno- 
tens 2 gelegenen Indexknoten 3 ubergegangen . Dieser Indexkno- 
ten enthalt zwei XPATH-Pfade "MDMVUAAt" und "MDMVUADFh". Der 
Suchstring liegt zwischen diesen beiden XPATH-Pf aden, so dass 
in der nachsten Hierarchieebene auf den zwischen Indexknoten 
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4 und Indexknoten 6 liegenden Indexknoten 5 ubergegangen 
wird. Dieser Indexknoten enthalt nunmehr als erstes Element 
den gesuchten XPATH-Pfad "MDMVUADDAN" sowie die gesuchte Wer- 
teauspragung "Discovery". Es wurde somit in dem Indexknoten 5 
die passende Werteauspragung gefunden und man erhalt dann die 
Position des entsprechenden Elementes im indizierten XML- 
Dokument. Dadurch, dass die Indexknoten in den Bitstrom gemafi 
der Depth-First-Ordnung eingefugt sind, werden alle weiteren 
Knoten des Indizierungsbaums bei der Suche ignoriert bzw. 
ubersprungen, so dass die Suche nach Elementen im Indizie- 
rungsbaum geringe Komplexitat aufweist. 

Im folgenden wird detailliert auf die Einfvigung der Indexda- 
ten, in den Bitstroms mittels des erf indungsgemafien Verfahrens 
eingegangen. Dies geschieht anhand der Figur 3, welche einen 
Ausschnitt auseinemmit dem erf indungsgemafieri. Verfahren ;er- 
zeugten Bitstrom darstellt. In dem in Figur 3 gezeigten Bit- 
strom sind iibersichtshalber die Nummern der Indexknoten auf- 
gefiihrt, wobei diese Nummern jedoch nicht mit dem Strom ii- 
bermittelt werden • Im Detail sind in Figur 3 die Inhalte der 
Indexknoten 1 und 3 gezeigt. Die Knoten enthalten als erstes 
Element zunachst die Anzahl der Eintrage, d.h. die Anzahl der 
in dem Knoten gespeicherten XPATH-Pfade. Fur den Indexknoten 
1 ergibt sich hier die Zahl 1 und fur den Indexknoten 3 die 
Zahl 2. Anschliefiend folgt fur jeden Eintrag der Schliissel, 
d.h. der jeweilige XPATH-Pfad sowie die Anzahl der Instanzi- 
ierungen, d.h. die Anzahl der Werteauspragungen, die dieser 
XPATH-Pfad in dem XML-Do kument hat. Fur den Indexknoten 1 er- 
gibt sich beispielsweise fur den XPATH-Pfad "MDMVUAFCN" die 
Instanziierungsanzahl 2 f da der Pfad mit den beiden Werteaus- 
pragungen "Total for Production" und "Broadcast" in dem XML- 
Do kument auftritt. Fur jede Werteauspragung wird ferner die 
Position dieser Werteauspragung in dem XML-Dokument in den 
Bitstrom eingefugt. Es ist bei dem erf indungsgemaJien Verfah- 
ren wesentlich, dass neben diesen Inf ormationen ferner in den 
Bitstrom die Information eingefugt wird r an welcher Position 
im Bitstrom - insbei^^M^re an welcher Position relativ zu^>}#^ 
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momentanen Position (offset) - sich die Indexdaten von mit 
dem jeweiligen Indexknoten verbundenen Indexknoten der darun- 
ter liegenden Hierarchieebene befinden. Hierdurch wird das 
Oberspringen von Knoten ermoglicht, die fur eine vorgegebene 
Suchabfrage nicht relevant sind. 

Im folgenden bezeichnet man die sich von einem Knoten in eine 
tiefer liegende Hierarchieebene verzweigenden Knoten als 
Kindknoten. Es ist bei dem erf indungsgemaiien Verfahren zu be- 
achten, dass die Information bezuglich der Position des ers- 
ten Kindknotens einer Hierarchieebene nicht gespeichert wer- 
den muss, da dieser Kindknoten im Bitstrom als nachster ein- 
gelesen wird. Wie der Figur 3 entnommen werden kann, werden 
somit fur den Indexknoten 1 lediglich die Position des Index- 
knotens 10 (als "offset (10)" bezeichnet) und far den Index- 
knoten 3 lediglich die Positionen der Indexknoten 5 und 6 
(bezeichnet als "offset (5)" und "offset (6)") gespeichert. Er- 
gibt sich beispielsweise, dass die gesuchte Information bei 
einer Abfrage lexikographisch grolier als der XPATH in Knoten 
1 ist, wird sofort zum Knoten 10 gesprungen, so dass es nicht 
mehr notwendig ist, den Indexknoten 2 und die sich von dem 
Indexknoten 2 verzweigenden Indexknoten zu durchsuchen. Hier- 
durch wird eine effektive Suche ermoglicht. 

In der nachf olgenden Tabelle ist nochmals aufgefuhrt, welche 
Informationen pro Knoten in dem Bitstrom gespeichert werden. 
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Tabelle : 



Knot en { 

Anzahl der Eintrage 
fur jeden Eintrag: 
Schliissel 

Anzahl der Instanziierungen 
fur jede Instanziierung: 

Werteauspragung 

Position 

fur jeden Kindknoten aufter den ersten 
Offset im 'Strom 



Der mit dem erf indungsgemaflen Verfahren erzeugte Bitstrom 
wird an den Empfanger ubermittelt und kann entsprechend einer 
Abfrage, die beispielhaft in Bezug auf Figur 2 erl&utert wur- 
de, ausgelesen werden. Durch Vergleiche zwischen dem abzufra- 
genden XPATH und den Eintragen in den Indexknoten werden so 
lange bestimmte Knoteninf ormationen aus dem Strom ausgelesen, 
bis der entsprechende gesuchte XPATH mit der gesuchten Werte- 
auspragung gefunden wurde oder bis kein passender XPATH-Pfad 
aufgrund der Sortierung mehr moglich ist. Im letzteren Fall 
ist die gewunschte Information im indizierten Dokument nicht 
enthalten. 




Im folgenden werden anhand der Figuren 4 bis 7, welche ver- 
einfachte Indizierungsbaume mit lexikographisch geordneten 
Eintrage darstellen, weitere Ausf iihrungsf ormen des erfin- 
dungsgemafien Verfahrens erlautert. In Figur 4 ist ein mittels 
des erf indungsgemafien Verfahrens zu codierender Indizierungs- 
baum gezeigt, der Knoten Kl bis K4 umfasst. Der Knoten Kl 
wird hierbei als Vaterknoten bezeichnet und die sich aus dem 
Kpoten Kl verzweigenden Knoten $2 .Ms|K4 :werden als Kindkno- 
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ten bezeichnet. Bei den Eintragen handelt es sich urn Pfade 
eines Dokumentenstrukturbaums . Statt im Bitstrom die Pfade 
rait ihrer gesamten Lange zu ubertragen, besteht die Moglich- 
keit, sog. relative Pfade in dem zu ubertragenden Indexknoten 
5 abzuspeichern, wobei diese Pfade relativ in Bezug auf einen 
im vorangegangenen iibertragenen Pfad des Vaterknotens bzw. in 
Bezug auf einen im vorangegangenen iibertragenen Pfad des itio- 
mentan zu ubertragenden Indexknotens sind. 

10 Die Einfugung von relativen Pfaden in den Bitstrom ist in Fi- 
gur 5 verdeutlicht . Hierbei bedeutet die Darstellung "." ei- 
nen Schritt zuruck in dem Pfad, auf den sich der relative 
Pfad bezieht. In dem Knoten Kl wird fur den Eintrag "AE" der 
relative Pfad "..E" in Bezug auf den vorangegangenen Eintrag 

15 AGB ubertragen. In den Kindknoten Kl, K2 und K3 werden je- 

weils 'in den zweiten und dritten Eintragen die relativen Pfa- 
de in Bezug auf den ersten Pfad des jeweiligen Kindknotens 
ubertragen. 

20 Bei der Ausf uhrungsf orm der Figur 5 wird ftir die ersten Pfade 
AA, ACC bzw. AEF der Kindknoten K2, K3 bzw. K4 der komplette 
absolute Pfad ubertragen. Es ist nun zusatzlich moglich, auch 
die ersten Pfade der Kindknoten als relative Pfade in Bezug 
auf einen Pfad des Vaterknotens Kl zu ubertragen. Dies ist in 

25 Figur- 6 dargestellt. Anstatt der Pfade AA und ACC der ersten 
und zweiten Kindknoten werden hierbei die relativen Pfade 
"..A" und ".C" in bezug auf den ersten Pfad des Vaterknotens 
ubertragen. Anstatt des Pfads "AEF" des dritten Kindknotens 
wird der relative Pfad "F" in bezug auf den zweiten Pfad des 

30 Vaterknotens ubertragen. Die Pfade werden hierbei vorzugswei- 
se in ihrer Bytedarstellung in den Bitstrom abgelegt. 

Durch die Verwendung von relativen Pfaden wird das Datenvolu- 
men im Strom stark verringert, da bei der Abspeicherung der 
35 Pfade Gemeinsamkeiten in den Pfaden ausgenutzt werden, so 

dass weniger Speicherplatz benotigt wird. Insbesondere miissen 
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bei relativen Pfaden die jeweiligen gemeinsamen Anteile der 
Pfade nur einmal ubermittelt werden. 

In einer weiteren Ausf uhrungsf orm der Erfindung wird eine Da- 
tenersparnis dadurch erreicht, dass bei der Anordnung der 
Eintrage der Indexknoten fur den ersten Kindknoten K2 eine 
gegenuber der Figur 4 umgekehrte Reihenfolge verwendet wird. 
Hierdurch wird erreicht, dass der Eintrag, der die groBte 
Ahnlichkeit zu dem vorangegangenen Vaterknoten Kl aufweist, 
am Anfang des Kindknotens K2 steht. Damit konnen sich bei 
speziellen Ausgestaltungen des Indizierungsbaums wesentlich 
verkurzte relative Pfade und ein verringerter Speicherbedarf 
ergeben. 

Die. Pfade konnen die bereits im vorangegangenen erwahnten 
XPATH-Pfade eines XML-Beschreibungsbaums. sein. Ferner. konnen 
die Pfade binar codiert sein, beispielsweise mit einem MPEG7- 
Codierverf ahren. Insbesondere konnen die in der bereits er- 
wahnten Referenz [3] spezif izierten Verf ahren zur Binarcodie- 
rung eingesetzt werden. Der Einsatz von binar codierten Pfa- 
den kann im Vergleich zu textuellen Reprasentationen zu Ein- 
sparungen bei der Anzahl der zu ubermittelnden Bits fuhren. 
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Patentanspriiche 

1. Verfahren zur Erzeugung eines Bitstroms aus einem Indi- 
zierungsbaum, wobei der Indizierungsbaum eine Mehrzahl 
von Hierarchieebenen umfasst und jeder Hierarchieebene 
ein oder mehrere Indexknoten (Kl, K2, K3, K4) zugeordnet 
sind, wobei die Indexknoten (Kl, K2, K3, K4) Indexdaten 
enthalten, die in dem Indizierungsbaum nach einem oder 
mehreren vorgegebenen Kriterien sortiert sind, bei dem: 

- die Indexdaten der Indexknoten (Kl, K2, K3, K4) in den 
Bit strom eingefiigt werden; 

- far. einen Indexknoten jeweils die Information in den 
Bitstrom : eingef ugt wird, an welcher Stelle im Bit strom 
sich-die .Indexdaten von einem oder mehreren Indexkno- 
ten (Kl, K2, K3, K4) der Hierarchieebene, die unter- 
halb der Hierarchieebene des jeweiligen . Knot ens liegt, 
bef inden. 

2. Verfahren nach Anspruch 1, bei dem der Indizierungsbaum 
ein B-Tree (= Balanced Tree) ist. 

3. Verfahren nach Anspruch 1 oder 2, bei dem die Indexdaten 
in dem Indizierungsbaum lexikographisch sortiert sind. 

4. Verfahren nach einem der vorhergehenden Anspriiche, bei 
dem die Indexdaten nach der Depth-First-Ordnung in den 
Bitstrom eingefiigt werden. 

5. Verfahren nach einem der vorhergehenden Anspruche, bei 
dem die Indexdaten Pfade eines Dokumentenstrukturbaums 
bestehend aus mindestens einen Wurzelknoten und eine 
Mehrzahl von Blattknoten umfassen. 

6. Verfahren nach Anspruch. 5, bei dem die Indexdaten die 
Werteauspragungen der : .|^ade v: uiM . die Positionen der Werte- 
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auspragungen in dem Dokument, das durch den Dokumenten- 
strukturbaum dargestellt ist, enthalten. 

Verfahren nach Anspruch 5 oder 6, bei dem die Indexdaten 
die Anzahl der Pfade in einem Indexknoten (Kl, K2, K3, 
K4) umfassen. 



8. 



Verfahren nach einem der Anspriiche 5 bis 7 , bei dem die 
Pfade absolute Pfade umfassen, die von dem Wurzelknoten 
10 beginnen und zu einem Blattknoten fiihren. 

9. Verfahren nach einem der Anspriiche 5 bis 8, bei dem die 
Pfade relative Pfade umfassen, wobei ein relativer Pfad 
eines jeweiligen Indexknotens (Kl, K2, K3, K4) ein Pfad 
relativ zu einem zuvor in den Bitstrom eingefugten Pfad 
des jeweiligen Indexknotens (Kl, K2, K3, K4) oder eines 
Indexknotens (Kl, K2, K3, K4) einer iiber der Hierarchie- 
ebene des jeweiligen Indexknotens (Kl, K2, K3, K4) li e - 
genden Hierarchieebene ist . 



15 



20 



25 



10. Verfahren nach Anspruch 9, bei dem die Pfade des Index- 
knotens, dessen Indexdaten als erste einer Hierarchieebe- 
ne in den Bitstrom eingefiigt werden, in einer Reihenfolge 
umgekehrt zu der Reihenfolge, in der die Indexdaten in 
dem Indexknoten (Kl, K2, K3, K4) angeordnet sind, in den 
Bitstrom eingefiigt werden. 



11. Verfahren nach einem der Anspriiche 5 bis 10, bei dem die 
Pfade Beschreibungselemente eines XML-Dokuments (XML = 

30 Extensible Markup Language) umfassen. 

12. Verfahren nach Anspruch 11, bei dem die Pfade XPATH-Pfade 
des XML-Dokuments sind. 



35 



13. Verfahren nach einem der vorhergehenden Anspriiche, bei 
dem die Indexdaten mit einem Codierverf ahren binar co- 
diert sind, insbesondere mit einem MPEG-Codierverf ahren . 
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14. Verfahren nach Anspruch 13, bei dem das Codierverf ahren 
ein MPEG7-Codierverf ahren ist. 

15. Verfahren zum Codieren einer Datenstruktur , bei dem die 
Datenelemente der Datenstruktur in einem Indizierungsbaum 
indiziert sind, wobei ein Bitstrom gemafl einem der vor- 
hergehenden Anspruche erzeugt wird und der Bitstrom Teil 
des codierten Datenstroms ist. 

16. Verfahren zum Decodieren einer Datenstruktur, wobei das 
Verfahren derart ausgestaltet ist, dass die gemafi An- 
spruch 12 codierte Datenstruktur decodiert wird. 

17. Verfahren zum Codieren und Decodieren einer Datenstruk- 
tur, umfassend das Verfahren . nach Anspruch 15 und das 
Verfahren nach Anspruch 16. 

18. Codiervorrichtung, mit der ein Verfahren nach Anspruch 15 
durchfiihrbar ist. 

19. Decodiervorrichtung mit der ein Verfahren nach Anspruch 
16 durchfiihrbar ist. 



20. Vorrichtung zum Codieren und Decodieren einer Datenstruk- 
tur, mit der ein Verfahren nach Anspruch 17 durchfiihrbar 
ist . 
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